17. 文本:总结 + 下节预告
二项分布
二项分布 帮助我们决定一系列独立的 '掷硬币等事件' 概率。
与二项分布相关的 概率质量函数 具有以下形式:
P(X = x) = \frac{n!}{x!(n-x)!}p^x(1-p)^{n-x}
其中 n 是事件数量, x 是 "成功" 的数量, p 是 "成功" 的概率。
我们现在可以使用这个分布决定下列事件的概率:
- 掷硬币 10 次出现 3 次正面的概率。
- 掷硬币 10 次出现 8 次以上正面的概率。
- 掷硬币 20 次不出现正面的概率。
下节预告
事实上你可能在实践中处理数据,通常会使用二项分布。所以计算这些概率并不重要 (即使在一些情况下非常有帮助)。更重要的是,你要了解二项分布的用途,因为它出现在机器学习的许多模型中,可以通过跟踪两个可能事件,悄悄接近我们的数据集。你可以在 Python 概率练习 一课进行更多相关练习。
二项分布中你看到最流行的地方之一是 逻辑回归 ,你将会在统计课的最后一节课中学到这个内容。
在接下来的部分中,你将开始解决非独立事件。我们目前所见到的事件不会相互影响,但在现实世界中远比这些复杂。下节课将介绍相依的概念,你将会在下面一部分学习更多贝叶斯规则。